查看原文
其他

原谷歌工程院长张智威清华开讲:研发医疗领域的AlphaGo

2017-02-23 认真聆听的 量子位
量子位 | 若朴 牧北 整理报道

HTC负责研发及医疗的总裁、原Google中国工程院副院长张智威(Edward Y. Chang)博士,周二上午做客清华并发表《研发面向健康的AlphaGo》演讲。

在演讲中,张智威介绍了医疗行业的现状和未来,以及HTC在这一领域的一些研究。

此外,张智威详细讲解了如何利用迁移学习的方法,把人工智能技术应用于疾病检测领域。张智威还对AlphaGo进行了剖析,并围绕如何研发医疗领域的AlphaGo进行了阐述。张智威还介绍了VR技术在医疗领域的应用。

清华大学计算机科学与技术系教授、中国中文信息学会副理事长孙茂松,在演讲开始前对张智威在Google和HTC的工作和学术情况进行了简要的介绍。

以下是张智威此次在清华开讲的视频,总时长大约是50分钟。此外,量子位还把张智威此次演讲的内容,重新整理成易读的文字版本。推荐关注人工智能、医疗、VR等领域的读者,观看或者阅读张智威此次在清华的分享。

现场视频

https://v.qq.com/txp/iframe/player.html?vid=e0377kz7rg2&width=500&height=375&auto=0

文字版本

近期医疗及HTC情况简介

医疗的发展,受到成本、品质、普及,三个方面互相牵制。比如成本降低,品质和普及率相应也会降低。品质要做好,成本必然会提升。

成本方面,以发达国家为例,美国公司每年要为员工支付1万美元的医疗保险,46%的美国居民生病了不去医院,而是自己在网上查询。从普及率上来讲,全球还有25亿人没有医疗设备, 非洲医生和病人的比例是1:2000。

品质方面,即使在美国有120万例误诊。所以品质-成本-普及都出现了问题,为什么呢?现在有一种反应式的诊断模型,就是根据你的检查结果推断病情。 现在已经到了医疗行业产生颠覆性创新的时候,这得益于几个重要技术的发展进步。

第一是AI和大数据,第二是移动设备,第三是移动传感器。这三个技术在一起,就会有革命性的颠覆。 基于这些技术,HTC正在进行新的探索。

例如,HTC正试图把医疗诊断从响应式(reactive model),转变为主动式(proactive model)。人体的健康数据,通过手机传入云端,经由分类器判断是否有健康问题的预兆。这些数据也会发送到医院,以确定是否需要进一步的检查。

这个模型的改进之处,首先是有基于云的医疗大数据、AI分析,其次是家中有一些便宜轻便的信息监控设备。HTC正在参加一个与此相关的《Tricoder XPRIZE大赛》,并且已经入围前两名。

这个比赛的挑战目标是推出5磅(4.5斤)以下,能检测15中疾病的便携设备。HTC团队的解决方案,是一个盒子+手机。能诊断中耳炎、黑色素瘤、尿道炎、中风、带状疱疹、贫血、肝病、肺炎、高血压、慢性阻塞性肺疾病等。

如何用AI进行疾病检测

以检测皮肤的黑色素瘤为例。想要解决这个问题,通常需要两类数据集,一类是黑色素瘤,一类是正常的痣。然后把数据丢到支持向量机或者深度学习网络中去学习。

但是我们发现一个问题,在医疗领域并没有大数据,疾病在正常情况下是小数据。以中耳炎为例,我们在台湾的医院里只收集到1000个病例,而且第一年我们还得和医生合作试图找到中耳炎的“特征值”。费劲半天,做出一个准确率80%的分类器。

第二年医生说不给钱就不合作了。怎么办?正好深度学习很火,于是我们就把数据都丢到深度学习网络中,然而,深度学习的结果更差。准确率只有70%。 于是我们就转向使用ImageNet的数据。

你可能会觉得奇怪,中耳炎的这种疾病的数据,跟ImageNet上都是锅碗瓢盆、汽车人脸的一般的数据,两者并没有什么相关性。怎么能用ImageNet帮助疾病诊断呢?

量子位注:此时开始有PPT入画 😂

这是一个CNN(卷积神经网络)的模型,假设我有一亿张照片进来,而且都没有打标签,这时候怎么进行训练?这是个编码的问题。PPT上,左右两边各有一个神经网络,图片丢入左侧的网络进行压缩编码,右边尝试还原图片。

通过原始图片和还原图片的比对,可以建立一个地面实况,这样再多的图片,都可以进行无监督学习。接着就可以进行稀疏编码。经过这样一个过程,一大堆跟中耳炎不相关的数据进行训练,把CodeBook训练出来。

然后再拿1000张中耳炎的图片进行训练。向网络中输入一张中耳炎的图片,跟原来不同的是网络中有了新的特征向量,最后我们的精度提高到91%。

为什么这种迁移学习的方法会有效?

这是吴恩达2009年发布的一个论文, 举这个例子想说明,不管上层的目标语义如何,底层的神经元(可以说是CodeBook)是共通的。所以,用莫名其妙的图片把底层网络训练得很稳定,这时候只需要用1000张中耳炎的图片调整上层网络即可。

为什么这个模式这么有效?到底哪些神经元被开启?当一个病人被诊断为中耳炎的时候,中部和底部被开启的神经元,居然是变形虫、红色的甲虫、红色的丝巾或者红酒,虽然这跟中耳炎看起来不一样,但是表明了患者的耳部有类似的现象。

以前我不是迁移学习的信徒,但是在这个案例里面,低层级的神经元,其实可以从另一个大数据集借鉴过来,这非常有趣。

心律不齐是个常见问题,但是想要构建一个分类器,全世界能用的数据只有两个数据集可用,一个在哈佛,一个在MIT,加起来只有200个病例数据,绝对是小数据。所以我们现在也在尝试建立新的数据集。

那么在语音、音乐方面的学习成果,能不能迁移到心电图领域?但过去两年,我们还没有得到任何的突破成果。希望大家可以继续研究。

复制AlphaGo

问诊,国内春雨医生,国外有几家也在做,我们对这个感兴趣,也是受到AlphaGo启发。AlphaGo的细节不说了,基本上就是两个分类器:策略网络和价值网络。DeepMind最初用6000万盘棋谱训练,但是训练出来的AlphaGo棋力只有一段。

然后AlphaGo开始随机调整策略网络,价值网络也开始尝试奇怪的下法,最终可以说AlphaGo自己跟自己下了无穷多盘围棋。

所以AlphaGo给大家最大启发,不是赢棋,而是如何构建一个智商超过300的机器。

构建的方法无非两件事:一是训练,速度快、可扩展,另外就是无限多的数据。如果能做好这件事,各位都是亿万富翁。最近两年,我们每天都在想,哪些领域可以拿到无限的数据。

Google曾经有一个项目,希望收集到全世界的医疗数据,做大数据的分析。但是最终这个项目失败了,因为隐私和数据太过分散等原因。那个负责人改去做股票,觉得股票有无限多的数据。

回到问诊这个事情上,医生询问之后还会进行化验,这个过程能不能变成在线的问答诊断呢?关键问题是,怎么用最少的问题,了解病人可能的病征。这个方法虽然不能确诊,但可以缩小范围,甚至帮助病人准确的挂号。

接下来就要依靠:CNN+强化学习。强化学习被用来在询问数量和诊断精度之间作一个平衡,目前对100种常见疾病已经做到50%的确诊率。

未来的挑战

其实我们就想在大家不舒服之前,就能诊断出来。这个怎么做呢?从概念上讲非常简单,就是收集很多很多的数据。哈佛列了一下医疗数据可能的来源,这些数据可能是结构化、半结构化、非结构化的,可能来自于医院、保险公司、社交媒体。

如果能收集到这些数据,接下来就是大数据的挑战。

过去的六七年里,我们在大数据算法方面,数据挖掘方面做了很多的工作。其中最难的是支持向量机,最简单的是深度学习。

总结一下,未来的趋势一个是精准医疗,基于大数据,以后每个人治病的用药可能都会不同。 比方说,维生素D每个人吸收的情况不同,有人吃下去是毒药,有些人无效。这些取决于每个人DNA的不同。但是仍然收集数据是最难的。

还有一个是精准手术,这个可以跟VR结合,提高脑部肿瘤手术的效率和精度。对于新技术, 有医院A的大夫说,如果当初有VR设备帮助,那个病人就不会死。医院B的大夫说,我们都是一流的大夫,用不着这个。

深度学习在这方面也有很多结合。医院C跟我们说,我们收到的病例非常多,能不能做一个AI的系统,帮我们判断病人是否还有救。如果还有希望,我们就收治。但是这个要求,我们不敢承接,就怕万一误判了怎么办。

深度学习最重要的就是快。

一个是训练要非常快。另外就是训练完成后,在手机或者移动设备上进行分类,如果模型太大的话,可能没有办法进行实时诊断。

快有很多方式,但深度学习基本上只有几件事。比方说全连接网络,就是在做相乘,这个是前向网络;后向网络也一样,就是矩阵相乘。所以瓶颈就在稠密矩阵相乘、卷积还有其他运算等等。也有很多可以进行优化的方法。

以及

在结束近一个小时的分享之后,张智威还在现场进行了半个小时的问答。张智威回答的问题包括如下几个方面:

提问:结构化医疗数据的采集的意义?

提问:少见的疾病,能否借助深度学习?

提问:神经网络如何解决在线问诊?

提问:VR在手术中如何实际应用?

提问:AI未来会取代医生么?

……

想要继续收看问答视频,请在量子位公众号对话界面回复:“张智威”三个字。


量子位招人啦

量子位最近准备招人,跟我们一起报道人工智能领域激动人心的故事:

基本条件有三个:

1、对人工智能兴趣浓厚,适应高强度工作

2、能流畅翻译外电,英文水平越高越好

3、重点大学本科以上学历

另外:

思维敏捷,文采飞扬,加分

勤奋刻苦,好奇心强,加分

关于量子位还不能透露太多,现在只能说非常靠谱 <( ̄︶ ̄)>

有兴趣的朋友,请发送简历和作品至:zhaopin@qbitai.com (等你来哟)

 扫码强行关注『量子位』

追踪人工智能领域最劲内容


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存